Bootstrapping (statistika)

Bootstrapping je v matematické statistice jakýkoli test nebo metrika, která používá náhodný výběr s vracením a spadá do širší třídy metod resamplingu, jež samy spadají mezi metody Monte Carlo. Bootstrapping se používá především pro odhad přesnosti (intervaly spolehlivosti, chyby predikce atd.) výběrových statistik.[1][2] Tato technika umožňuje odhad distribuce téměř jakékoli výběrové statistiky pomocí metod náhodného výběru.[3]

Bootstrapping odhaduje distribuci výběrové statistiky a/nebo její vlastnosti (například její rozptyl) mnohonásobným opakováním výběru s vracením z aproximujícího rozdělení. Běžnou standardní volbou pro aproximující rozdělení je empirická distribuční funkce pozorovaných dat. V případě, kdy lze předpokládat, že pozorování v souboru jsou nezávislá a stejně rozdělená, lze to provést vytvořením řady výběrů s vracením z pozorovaného souboru dat (o stejném rozsahu jako pozorovaný soubor dat) .

Bootstrapping lze také použít pro testování hypotéz. Často se používá jako alternativa ke statistickým odhadům a testům založeným na předpokladu parametrického modelu, když je tento předpoklad pochybný anebo pokud je parametrický závěr nemožný nebo vyžaduje složité vzorce pro výpočet standardních chyb.

Bootstrapping publikoval Bradley Efron v článku „Bootstrap methods: another look at the jackknife“ (1979),[4][5] inspirovaným dřívějšími pracemi na metodě jackknife.[6][7][8] Vylepšené odhady rozptylu byly vyvinuty později.[9][10] Bayesovské rozšíření bylo publikováno v roce 1981.[11] Booststrap korigovaný na vychýlení a zrychlený (bias-corrected and accelerated, BCa) publikoval Efron v roce 1987 a algoritmus ABC v roce 1992.[12]

  1. EFRON, B.; TIBSHIRANI, R. An Introduction to the Bootstrap. Boca Raton, FL: Chapman & Hall/CRC, 1993. ISBN 0-412-04231-2. 
  2. Second Thoughts on the Bootstrap – Bradley Efron, 2003
  3. Weisstein, Eric W. "Bootstrap Methods." From MathWorld--A Wolfram Web Resource. http://mathworld.wolfram.com/BootstrapMethods.html
  4. Notes for Earliest Known Uses of Some of the Words of Mathematics: Bootstrap (John Aldrich)
  5. Earliest Known Uses of Some of the Words of Mathematics (B) (Jeff Miller)
  6. Quenouille M (1949) Approximate tests of correlation in time-series. J Roy Statist Soc Ser B 11 68–84
  7. Tukey J (1958) Bias and confidence in not-quite large samples (abstract). Ann Math Statist 29 614
  8. Jaeckel L (1972) The infinitesimal jackknife. Memorandum MM72-1215-11, Bell Lab
  9. Bickel P, Freeman D (1981) Some asymptotic theory for the bootstrap. Ann Statist 9 1196–1217
  10. Singh K (1981) On the asymptotic accuracy of Efron’s bootstrap. Ann Statist 9 1187–1195
  11. Rubin D (1981). The Bayesian bootstrap. Ann Statist 9 130–134
  12. Diciccio T, Efron B (1992) More accurate confidence intervals in exponential families. Biometrika 79 231–245

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne